阿里团队刚发布的重磅图像生成基础模型,多重条件引导+图像合成,SD级别,5B参数
阿里巴巴团队开发的这个重磅图像生成模型 Compose,支持多重引导条件的图像生成(合成)(扩散模型)。跟 Stable Diffuison 属于同等级别的基础模型,但路线有差异。
用文本prompt引导的风格迁移
Remix,风格插值(Style Interpolations)
input image (最左边娃娃图)+ 不同 sketch 引导图的重组合成 (Reformulation)。最右边一张 跟 神奈川冲浪图sketch 的合成让我影响深刻,integration 很 makesense,不生硬。
4重引导条件 (shape + sketch + palette + pic)的合成结果
1. 图像插值 Interpolations 的demo。
第二行起,左边的小图是调色板、轮廓图等 引导条件,图中可见 加入引导条件后,对 第一行最左和最右两张图像remix 结果的影响。引导条件决定了remix 过程中的哪些图像要素得如何变化,哪些要素得到保留。
2. 图像重构 Reconfigurations 的 demo
差不多就这些了。项目的Github 上承诺会逐步放出 代码和预训模型、带GUI的 Gradio 应用,兼容 SD2.1 的轻型模型。
从设计feature和 Demo的效果看,我个人感觉 Composer 会在消费级应用上更有竞争力,对普通人使用门槛更低,应用场景更广泛。
祝这个行业越来越卷
Github: https://github.com/damo-vilab/composer
Paper: arxiv.org/abs/2302.09778
Project page: damo-vilab.github.io/composer-page/
我刚刚发布了 AIGC 艺术家样式库 lib.KALOS.art 。4人小团队前后忙了4周。
艺术家和多种主题的结合,会带来很多意想不到的结果
后现代舞台设计师去画废土科幻场景?or 立体主义雕塑家去画一张猫咪?
按人类惯有思维,用肖像画家去生成肖像,用风景画家去生成风景,其实限制了AI模型的创作力和可能性。希望 lib.kalos.art能帮你发掘AIGC的潜力,得到更多创作灵感
点击阅读原文,访问最新最全的 AIGC 艺术样式数据库